خوشه بندی متغیرها به عنوان یک روش جدید در رگرسیون و دسته بندی:کاربرد در تشخیص سرطان وبهجت ودسته بندی خرما و روغن های خوراکی
پایان نامه
- وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز - دانشکده علوم
- نویسنده صادق کریمی
- استاد راهنما بهرام همتی نژاد
- سال انتشار 1391
چکیده
در روش های کالیبراسیون چند متغیره که توسط رگرسیون جزء اصلی(pcr)انجام می شود، جزء های اصلی (pcs) از کل ناحیه طیفی استخراج می شوند، وهمانطور که می دانیم بعضی از نواحی طیفی حاوی اطلاعات مفید نیستند. به همین خاطر یک روش خوشه بندی بر مبنای تشخیص الگو غیرنظارتی برای شناسایی نواحی طیفی مفید پیشنهاد شد. سپس اطلاعات مفید ناحیه انتخاب شده جهت ساختن یک مدل چند متغیره پایدار بوسیله رگرسیون جزء اصلی (pcr) مورد استفاده قرار گرفت. در این روش جدید که رگرسیون جزء اصلی خوشه بندی شده نام دارد (spcar) طیف ها به خوشه های متفاوتی توسط روش نقشه خودسازماندهی (som)تقسیم می شوند. در مرحله بعد، داده های طیفی هر خوشه توسط روش آنالیز جزء اصلی مورد بررسی قزار گرفته و جزء های اصلی (pcs) که بوسیله روش انتخاب گام به گام (step wise selection ) برگزیده شده اند ،به عنوان ورودی روش کالبیراسیون کمترین مربعات معکوس (ils) مورد استفاده قرار می گیرند. ولی همانطور که می دانیم خوشه بندی می تواند توسط الگوریتم های خطی متفاوتی نظیر آنالیز جزء اصلی (pca) ،خوشه بندی سلسله مراتبی، خوشه بندی کا امین میانگین (k-means) و خوشه بندی اشتراکی نظیر فازی و همچنین خوشه بندی غیرخطی نظیر نقشه خودسازماندهی (som ) انجام بگیرد. در یک مطالعه جدید توانمندی هر کذام از این روش ها در خوشه بندی طیف ها مورد بررسی قرار گرفت . پارامترهای آماری بدست آمده نشان داد که خوشه بندی غیرخطی نظیر (som) توانایی بیشتری در خوشه بندی داده ها دارد. در مطالعه بعد چون توانایی روش خوشه بندی در روش های کالیبراسیون چند متغیره اثبات شده بود،از این روش برای انتخاب متغیر های مهم در روش های دسته بندی مورد استفاده قرار گرفت. این روش که خوشه بندی متغیر ها (clustering of variable,clova) نام دارد برای آنالیز دادهای پروتئومیکس مورد استفاده قرار گرفت. در این روش، متغیرهای طیفی توسط روش نقشه خود سازماندهی (som) خوشه بندی می شوند سپس هر خوشه بوسیله روش های دسته بندی مورد آنالیز قرار می گیرد. در نهایت این روش جدید (clova) برای آنالیز عکس های بدست آمده از دستگاه ژل الکتروفورز در تشخیص بیماری بهجت (که یکی از بیماری های جدی در ایران ) مورد استفاده قرار گرفت. آنالیز داده ها نشان داد که روش پیشنهادی خوشه بندی متغیرها توانست نمونه های بیمار را از سالم بدون خطا دسته بندی کند. در قسمت دوم این پایان نامه، کاربرد روش های دسته بندی و خوشه بندی متغیرها همراه با طیف های ft-ir برای بررسی کنترل کیفیت مواد غذایی مورد بررسی قرار گرفت. طیف های جذبی ft-ir برای نمونه های روغن چرب و گیاهی ثبت شد و توسط روش های دسته بندی کالیبراسیون کمترین جزیی – آنالیز تفکیک کننده (pls-da)،کالیبراسیون کمترین جزیی –آنالیز تفکیک کننده فاصله ای (ipls-da)، آنالیز متغیر متعارف بسط داده شده (ecva) و نوع فاصله ای آن (interval-ecva) مورد بررسی قرار گرفتند. با مقایسه نتایج بدست آمده ، interval –ecvaتوانست همه نمونه های روغن (چرب و گیاهی) را بدون خطا از هم جدا کند. در نهایت میوه خرما از تنوع های مختلف (نرم ، نیمه خشک و خشک )بدست آمده از ناحیه جنوب ایران، برای میزان آنتی اکسیدانی و درصد پلی فنلی کل مورد آنالیز قرار گرفتند. همچنین طیف های عبوریft-ir بدست آمده از پلی فنل این میوه برای آنالیز خوشه بندی مورد استفاده قرار گرفت. نتایج بدست آمده نشان داد که میتوان نمونه های خرمای نرم ، نیمه خشک و خشک را بر اساس میزان پلی فنلی کل آنها خوشه بندی کرد.
منابع مشابه
ارایه شاخصی جدید جهت سنجش اعتبار خوشه بندی در الگوریتم های خوشه بندی فازی نوع-2
One of the main issues in fuzzy clustering is to determine the number of clusters that should be available before clustering and selection of different values for the number of clusters will lead to different results. Then, different clusters obtained from different number of clusters should be validated with an index. But so far such an index has not been introduced for interval type-2 fuzzy C...
متن کاملDegenerate Four Wave Mixing in Photonic Crystal Fibers
In this study, Four Wave Mixing (FWM) characteristics in photonic crystal fibers are investigated. The effect of channel spacing, phase mismatching, and fiber length on FWM efficiency have been studied. The variation of idler frequency which obtained by this technique with pumping and signal wavelengths has been discussed. The effect of fiber dispersion has been taken into account; we obtain th...
متن کاملیک روش ترکیبی خوشه بندی مبتنی بر الگوریتم ژنتیک با استفاده از عملگر های جدید تغییر
The clustering problem under the criterion of minimum sum of squares is a non-convex and non-linear program, which possesses many locally optimal values, resulting that its solution often being stuck at locally optimal values and therefore cannot converge to global optima solution. In this paper, we introduce several new variation operators for the proposed hybrid genetic algorithm for the cl...
متن کاملارائه یک الگوریتم خوشه بندی برای داده های دسته ای با ترکیب معیارها
Clustering is one of the main techniques in data mining. Clustering is a process that classifies data set into groups. In clustering, the data in a cluster are the closest to each other and the data in two different clusters have the most difference. Clustering algorithms are divided into two categories according to the type of data: Clustering algorithms for numerical data and clustering algor...
متن کاملخوشه بندی بیانی پروتئین های سرطان دهانه رحم
مقدمه: سرطان دهانه رحم، دومین سرطان مرگ بار بین زنان در کشورهای در حال توسعه و هفتمین در کشورهای پیشرفته است. غربالگری در سرطان گردن رحم برای پیدا کردن ژن ها و پروتئین هایی که نقش بیومارکر تشخیصی و درمانی بازی کند در حال پیشرفت است از طرفی مکانیسم ملکولی تومورزایی وابسته به دسته های پروتئینی است که در حالت بیماری تغییر می نماید بنا بر این کشف این گروه های پروتئینی امری ضروری به نظر می رسد. در ا...
متن کاملخوشه بندی و رتبه بندی پیمانکاران با استفاده از مدل های خوشه بندی و ویکور (مطالعه موردی: مسکن مهر شهر جدید هشتگرد)
مدیریت بر اجرای طرح های مسکن مهر که نیازمند سرعت عمل بسیار زیاد و در حجم گسترده است تنها با دریافت و پردازش صحیح و به موقع داده ها و اطلاعات قابل اعتماد محقق خواهد شد. برنامه ریزی های بلند مدت مدیران در تمامی سطوح پروژه های مسکن مهر که مسیر حرکت و نحوه ی عملکرد کلیه ی دست اندرکاران طرح مسکن مهر را تعیین می کند بر مبنای تحلیل داده های موجود انجام می شود. شرکت عمران شهر جدید هشتگرد به عنوان یکی ...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز - دانشکده علوم
کلمات کلیدی
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023